iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 21
0
自我挑戰組

30天菜鳥學 Linux 系列 第 21

21天- go pup + curl ~

  • 分享至 

  • xImage
  •  

今天進度 : 鳥哥的 Linux 私房菜 -- Linux 基礎


另外今天發現一個很酷的工具

ericchiang/pup: Parsing HTML at the command line

需要先安裝好 go 環境

test@test:~$ sudo apt  install golang-go
test@test:~$ sudo go get github.com/ericchiang/pup

可以跟 curl 串聯使用,像 js selector 一樣抓取網頁資料

# this fetches the nytimes homepage
curl -L http://www.nytimes.com
# Try it again, but pipe it into pup and select for headlines
curl -s -L http://www.nytimes.com | pup 'h2.story-heading a text{}'
# Let's get the URLs for those headlines
# We want to extract the 'href' attribute:
curl -s -L http://www.nytimes.com | pup 'h2.story-heading a attr{href}'

上一篇
20天-解決 Hyper-V 設固定IP後重啟還會浮動IP問題
下一篇
22天-終於知道 hyper-v 如何不汙染到公司環境,愉快的使用 SSH 連線 ubuntu
系列文
30天菜鳥學 Linux 59
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言